10 research outputs found

    Fairness-aware Machine Learning in Educational Data Mining

    Get PDF
    Fairness is an essential requirement of every educational system, which is reflected in a variety of educational activities. With the extensive use of Artificial Intelligence (AI) and Machine Learning (ML) techniques in education, researchers and educators can analyze educational (big) data and propose new (technical) methods in order to support teachers, students, or administrators of (online) learning systems in the organization of teaching and learning. Educational data mining (EDM) is the result of the application and development of data mining (DM), and ML techniques to deal with educational problems, such as student performance prediction and student grouping. However, ML-based decisions in education can be based on protected attributes, such as race or gender, leading to discrimination of individual students or subgroups of students. Therefore, ensuring fairness in ML models also contributes to equity in educational systems. On the other hand, bias can also appear in the data obtained from learning environments. Hence, bias-aware exploratory educational data analysis is important to support unbiased decision-making in EDM. In this thesis, we address the aforementioned issues and propose methods that mitigate discriminatory outcomes of ML algorithms in EDM tasks. Specifically, we make the following contributions: We perform bias-aware exploratory analysis of educational datasets using Bayesian networks to identify the relationships among attributes in order to understand bias in the datasets. We focus the exploratory data analysis on features having a direct or indirect relationship with the protected attributes w.r.t. prediction outcomes. We perform a comprehensive evaluation of the sufficiency of various group fairness measures in predictive models for student performance prediction problems. A variety of experiments on various educational datasets with different fairness measures are performed to provide users with a broad view of unfairness from diverse aspects. We deal with the student grouping problem in collaborative learning. We introduce the fair-capacitated clustering problem that takes into account cluster fairness and cluster cardinalities. We propose two approaches, namely hierarchical clustering and partitioning-based clustering, to obtain fair-capacitated clustering. We introduce the multi-fair capacitated (MFC) students-topics grouping problem that satisfies students' preferences while ensuring balanced group cardinalities and maximizing the diversity of members regarding the protected attribute. We propose three approaches: a greedy heuristic approach, a knapsack-based approach using vanilla maximal 0-1 knapsack formulation, and an MFC knapsack approach based on group fairness knapsack formulation. In short, the findings described in this thesis demonstrate the importance of fairness-aware ML in educational settings. We show that bias-aware data analysis, fairness measures, and fairness-aware ML models are essential aspects to ensure fairness in EDM and the educational environment.Ministry of Science and Culture of Lower Saxony/LernMINT/51410078/E

    A survey on datasets for fairness-aware machine learning

    Get PDF
    As decision-making increasingly relies on machine learning (ML) and (big) data, the issue of fairness in data-driven artificial intelligence systems is receiving increasing attention from both research and industry. A large variety of fairness-aware ML solutions have been proposed which involve fairness-related interventions in the data, learning algorithms, and/or model outputs. However, a vital part of proposing new approaches is evaluating them empirically on benchmark datasets that represent realistic and diverse settings. Therefore, in this paper, we overview real-world datasets used for fairness-aware ML. We focus on tabular data as the most common data representation for fairness-aware ML. We start our analysis by identifying relationships between the different attributes, particularly with respect to protected attributes and class attribute, using a Bayesian network. For a deeper understanding of bias in the datasets, we investigate interesting relationships using exploratory analysis

    Study on biomass and carbon stock of woody floor at several forests in Bach Ma national park, Thua Thien Hue province

    No full text
    The aims of the research are to identify biomass and estimate carbon stock of woody floor at some forest status in Bach Ma National Park and to recommend some solutions in order to improve the effectiveness of forest management toward sustainable development. Collecting the relative data through articles, books, internet information and organizations and inheriting the data from previous research on biomass and carbon stock. Moreover, the research implemented field surveys by designing 31 circular plots (1,256 m2) with three radii including 4 m, 14 m and 20 m for measuring trees from 5 to 20 cm, 20-50 cm and > 50 cm DBH (diameter at breast height), respectively. Correspondingly, D1.3, H were measured. The results showed that biomass of rich, medium and restoration forests are 144.16, 43.17 and 20.31 ton/ ha, respectively. The total average C-stock is calculated as follows: rich forest 264.53 (ton/ha), medium forest (79.21 ton/ha) and restoration forest (37.27 ton/ha). Therefore, the rich forest has the highest CO2 absorption (399.78 ton/ha). Meanwhile, CO2 absorption of medium and restoration forests are 133.13 ton/ha and 46.81 ton/ha.Mục tiêu của đề tài là nghiên cứu sinh khối và trữ lượng carbon của tầng cây gỗ tại một số trạng thái rừng thuộc vườn quốc gia Bạch Mã, tỉnh Thừa Thiên Huế. Để thực hiện được mục tiêu đó, đề tài cần xác định sinh khối của tầng cây gỗ ở một số trạng thái rừng tại vườn quốc gia Bạch Mã, đánh giá trữ lượng carbon của tầng cây gỗ ở một số trạng thái rừng tại vườn quốc gia Bạch Mã, đề xuất một số giải pháp nhằm nâng cao hiệu quả quản lý rừng theo hướng phát triển bền vững. Đề tài tiến hành thu thập các số liệu có liên quan bằng cách tham khỏa tài liệu từ sách báo, internet, tìm kiếm thông tin từ các cơ quan, ban ngành, kế thừa số liệu từ các công trình nghiên cứu sinh khối và trữ lượng carbon. Bên cạnh đó, đề tài còn thực hiện quá trình đi điều tra thực địa lập 31 ô tiêu chuẩn, mỗi ô tiêu chuẩn có diện tích là 1256m2, ô tiêu chuẩn hình tròn với 3 cấp bán kính là 4m, 14m, 20m tương ứng với đường kính cây lần lượt là 5-20cm, 20-50cm và lớn hơn 50 cm. Tiến hành đo các chỉ số sinh trưởng của cây là D1.3, Hvn. Kết quả nghiên cứu cho thấy sinh khối trạng thái rừng giàu chiếm khối lượng lớn nhất khoảng 144,16 tấn/ha, tiếp đến là trạng thái rừng trung bình chiếm 43,17 tấn/ha và rừng phục hồi là 20,31 tấn/ha. Đối với trữ lượng carbon thì rừng giàu là 264,53 tấn/ha, rừng trung bình là 79,21 tấn/ha, rừng phục hồi là 37,27 tấn/ha. Xét về khả năng hấp thụ CO2 thì trạng thái rừng giàu là hấp thụ nhiều nhất khoảng 399,78 tấn/ha, thấp nhất là rừng phục hồi với 46,81 tấn/ha, còn rừng trung bình là 133,13 tấn/ha

    Study on biomass and carbon stock of woody floor at several forests in Bach Ma national park, Thua Thien Hue province

    No full text
    The aims of the research are to identify biomass and estimate carbon stock of woody floor at some forest status in Bach Ma National Park and to recommend some solutions in order to improve the effectiveness of forest management toward sustainable development. Collecting the relative data through articles, books, internet information and organizations and inheriting the data from previous research on biomass and carbon stock. Moreover, the research implemented field surveys by designing 31 circular plots (1,256 m2) with three radii including 4 m, 14 m and 20 m for measuring trees from 5 to 20 cm, 20-50 cm and > 50 cm DBH (diameter at breast height), respectively. Correspondingly, D1.3, H were measured. The results showed that biomass of rich, medium and restoration forests are 144.16, 43.17 and 20.31 ton/ ha, respectively. The total average C-stock is calculated as follows: rich forest 264.53 (ton/ha), medium forest (79.21 ton/ha) and restoration forest (37.27 ton/ha). Therefore, the rich forest has the highest CO2 absorption (399.78 ton/ha). Meanwhile, CO2 absorption of medium and restoration forests are 133.13 ton/ha and 46.81 ton/ha.Mục tiêu của đề tài là nghiên cứu sinh khối và trữ lượng carbon của tầng cây gỗ tại một số trạng thái rừng thuộc vườn quốc gia Bạch Mã, tỉnh Thừa Thiên Huế. Để thực hiện được mục tiêu đó, đề tài cần xác định sinh khối của tầng cây gỗ ở một số trạng thái rừng tại vườn quốc gia Bạch Mã, đánh giá trữ lượng carbon của tầng cây gỗ ở một số trạng thái rừng tại vườn quốc gia Bạch Mã, đề xuất một số giải pháp nhằm nâng cao hiệu quả quản lý rừng theo hướng phát triển bền vững. Đề tài tiến hành thu thập các số liệu có liên quan bằng cách tham khỏa tài liệu từ sách báo, internet, tìm kiếm thông tin từ các cơ quan, ban ngành, kế thừa số liệu từ các công trình nghiên cứu sinh khối và trữ lượng carbon. Bên cạnh đó, đề tài còn thực hiện quá trình đi điều tra thực địa lập 31 ô tiêu chuẩn, mỗi ô tiêu chuẩn có diện tích là 1256m2, ô tiêu chuẩn hình tròn với 3 cấp bán kính là 4m, 14m, 20m tương ứng với đường kính cây lần lượt là 5-20cm, 20-50cm và lớn hơn 50 cm. Tiến hành đo các chỉ số sinh trưởng của cây là D1.3, Hvn. Kết quả nghiên cứu cho thấy sinh khối trạng thái rừng giàu chiếm khối lượng lớn nhất khoảng 144,16 tấn/ha, tiếp đến là trạng thái rừng trung bình chiếm 43,17 tấn/ha và rừng phục hồi là 20,31 tấn/ha. Đối với trữ lượng carbon thì rừng giàu là 264,53 tấn/ha, rừng trung bình là 79,21 tấn/ha, rừng phục hồi là 37,27 tấn/ha. Xét về khả năng hấp thụ CO2 thì trạng thái rừng giàu là hấp thụ nhiều nhất khoảng 399,78 tấn/ha, thấp nhất là rừng phục hồi với 46,81 tấn/ha, còn rừng trung bình là 133,13 tấn/ha

    Study on biomass and carbon stock of woody floor at several forests in Bach Ma national park, Thua Thien Hue province

    Get PDF
    The aims of the research are to identify biomass and estimate carbon stock of woody floor at some forest status in Bach Ma National Park and to recommend some solutions in order to improve the effectiveness of forest management toward sustainable development. Collecting the relative data through articles, books, internet information and organizations and inheriting the data from previous research on biomass and carbon stock. Moreover, the research implemented field surveys by designing 31 circular plots (1,256 m2) with three radii including 4 m, 14 m and 20 m for measuring trees from 5 to 20 cm, 20-50 cm and > 50 cm DBH (diameter at breast height), respectively. Correspondingly, D1.3, H were measured. The results showed that biomass of rich, medium and restoration forests are 144.16, 43.17 and 20.31 ton/ ha, respectively. The total average C-stock is calculated as follows: rich forest 264.53 (ton/ha), medium forest (79.21 ton/ha) and restoration forest (37.27 ton/ha). Therefore, the rich forest has the highest CO2 absorption (399.78 ton/ha). Meanwhile, CO2 absorption of medium and restoration forests are 133.13 ton/ha and 46.81 ton/ha.Mục tiêu của đề tài là nghiên cứu sinh khối và trữ lượng carbon của tầng cây gỗ tại một số trạng thái rừng thuộc vườn quốc gia Bạch Mã, tỉnh Thừa Thiên Huế. Để thực hiện được mục tiêu đó, đề tài cần xác định sinh khối của tầng cây gỗ ở một số trạng thái rừng tại vườn quốc gia Bạch Mã, đánh giá trữ lượng carbon của tầng cây gỗ ở một số trạng thái rừng tại vườn quốc gia Bạch Mã, đề xuất một số giải pháp nhằm nâng cao hiệu quả quản lý rừng theo hướng phát triển bền vững. Đề tài tiến hành thu thập các số liệu có liên quan bằng cách tham khỏa tài liệu từ sách báo, internet, tìm kiếm thông tin từ các cơ quan, ban ngành, kế thừa số liệu từ các công trình nghiên cứu sinh khối và trữ lượng carbon. Bên cạnh đó, đề tài còn thực hiện quá trình đi điều tra thực địa lập 31 ô tiêu chuẩn, mỗi ô tiêu chuẩn có diện tích là 1256m2, ô tiêu chuẩn hình tròn với 3 cấp bán kính là 4m, 14m, 20m tương ứng với đường kính cây lần lượt là 5-20cm, 20-50cm và lớn hơn 50 cm. Tiến hành đo các chỉ số sinh trưởng của cây là D1.3, Hvn. Kết quả nghiên cứu cho thấy sinh khối trạng thái rừng giàu chiếm khối lượng lớn nhất khoảng 144,16 tấn/ha, tiếp đến là trạng thái rừng trung bình chiếm 43,17 tấn/ha và rừng phục hồi là 20,31 tấn/ha. Đối với trữ lượng carbon thì rừng giàu là 264,53 tấn/ha, rừng trung bình là 79,21 tấn/ha, rừng phục hồi là 37,27 tấn/ha. Xét về khả năng hấp thụ CO2 thì trạng thái rừng giàu là hấp thụ nhiều nhất khoảng 399,78 tấn/ha, thấp nhất là rừng phục hồi với 46,81 tấn/ha, còn rừng trung bình là 133,13 tấn/ha

    Amerasia Journal

    No full text
    corecore